【数字社会·观点视角】公共数据精细化治理的浙江实践
以下文章来源于数字浙江DZJ ,作者陈鹏宇
2021年7月20日第7期《中国信息化》杂志“数字浙江”专栏报道
编者按
今年是浙江省数字化改革元年。2月18日,浙江召开全省数字化改革大会,省委书记袁家军强调,数字化改革要从整体上推动省域经济社会发展和治理能力的质量变革、效率变革、动力变革,在根本上实现全省域整体智治、高效协同,努力成为“重要窗口”的重大标志性成果。
01
因数施策:
浙江首创“GPS”分域管理
图 | 公共数据平台“GPS”分域管理示意
划分“G域”,满足政府侧内部共享需求
其次,政府内部数据的纵向共享,要求公共数据平台采用多层多域的细分管理模式。“多层”即实现省市县三级数据的高效归集、回流,“多域”即区分并满足不同市县、不同部门的数据需求。如此一来,省市县三级的数据完整性均得到了提高,有利于激活不同层级、不同部门的应用创新积极性。
总之,政府侧的需求变高了,是划分“G域”的原因。
划分“S域”,满足社会侧开放融合需求
公共数据平台不仅要为政府数据应用提供支撑,还要为社会化应用提供支撑。但是,公共数据在政府内部和面向社会使用是两种截然不同的场景,尤其是后者还涉及复杂的数据隐私、数据融合问题,数据管理的制度流程、安全规范存在巨大差异,政府内部数据的共享体系无法为数据开放提供支撑。面对新的场景需求,有必要在公共数据平台中开辟出一块新的“S域”,为公共数据的开放和融合提供一个安全、好用的环境。
“S域”中的数据分为三类:一是可公开的数据,二是受限开放数据,三是为满足融合应用而导入的社会数据。从这个角度看,“S域”搭建了政府公共数据和社会数据的融合的桥梁。
设置“P域”,实施数据治理
原先,公共数据从数源单位归集到公共数据平台后,共享给了使用单位。但是,共享数据质量如何,能否满足使用需求?这些问题常不得而知。“P域”为实施数据治理提供了空间,为解决数据完整性、时效性、准确性等数据质量问题创造了条件。
公共数据平台实施“GPS”分域管理,是浙江在数据管理探索实践中的首创。“因数施策”的结果,是平台更能精准地满足不同需求。“GPS”三个域各有分工、各有侧重:“G域”满足了政府内部多样化的数据需求,为省市县数据纵向贯通提供了载体;“S域”保障了公共数据安全地开放和融合;“P域”为提升数据质量、精细化治理数据提供了载体。
多点发力:
浙江公共数据治理显成效
02
数据高铁提升数据归集效率
数据从“娘家”到“婆家”要翻山越岭,数据共享不及时、数据丢失成为棘手挑战。数据从数源单位到使用单位,不仅慢得像坐“绿皮火车”,而且整个过程如同“黑盒子”。一条数据在传输时平均要中转六七次,任何一个环节出故障都会导致数据错误或丢失。
为从根本解决上述问题,2020年浙江启动了“数据高铁”建设。数据高铁消除了数据供应链中间环节,让数据从“起点站”直达“终点站”,保障数据供应一条不漏、一条不差,实现秒级、分钟级的数据更新。
“数据高铁”是对数据供应链的一次重塑。原来,数据归集链路是从数源单位逐级“推”到公共数据平台,越到下游越难把关,出现问题时易推诿扯皮。如今,数据高铁直通数源,需求侧可直接从数源单位“拉”数据,权责简单明了,实现全链路数据可量化、问题可定位、责任可追溯。截至目前,浙江已经开行了36条数据高铁,“发车”8亿多次,建成了覆盖全省的数据资源实时调度的网络。
数据回流满足基层数据需求
数据回流是一种自上而下、批量回流的数据共享模式,具体而言,是基于数据分域管理机制,将归集于省公共数据平台的地域数据分批次回流共享至市县公共数据平台,以提高市县公共数据的完整度。浙江在推行数据回流工作之初,曾形象地描述为“数据回家”。
数据回流的操作路径是:各地市在省公共数据平台上建设数据仓,从而共享省平台数据。各地市在省平台上获得的一块供自己使用的空间,可称之为“数据飞地”。
以衢州为例,衢州市为了调用省平台的数据,在省平台上建设“数据飞地”。该“数据飞地”相当于快递中转站,省平台把要寄的包裹(数据)批量放到快递中转站(数据飞地),再寄回衢州分发到客户(数据使用单位)。衢州“数据飞地”与当地公共数据平台互通,衢州也可将本地数据传输至“数据飞地”并进行数据采集任务配置、数据加工。这样,市本级数据又和省平台数据做了一次融合。同理,衢州市下属的柯城、开化、龙游等均可到衢州市公共数据平台建“数据飞地”,实现市域的数据融合。
数据回流很好地满足了市县基层的数据需求,激活了基层的应用创新活力。截至目前,浙江省公共数据平台已向11个设区市市级平台回流220个类、累计7.12亿条数据,同期省大数据局指导各地市按需开展数据向县级平台回流工作。
推动公共数据面向社会开放
为更好地推动数据开放,浙江在制度建设、技术应用、服务支撑等方面进行了系统实践。
首先,完善配套制度。2020年8月1日,《浙江省公共数据开放与安全管理暂行办法》实施,它是全国首部省域公共数据开放“立法”,提出了数据分类分级开放的要求。今年,浙江正在加快制订《浙江省公共数据条例》,进一步完善数据共享和开放制度。
其次,突出技术应用。浙江在省公共数据平台上,基于“S域”开发了数据“开放域”系统,让数据在脱敏环境下,以“可用不可见”的方式,支撑政府公共数据安全、合规地向社会开放,实现公共数据和社会数据的融合应用。
再次,强化服务支撑。继去年举办首届大赛后,2021浙江数据开放创新应用大赛已鸣锣开赛,大赛以“助力改革·赋能创新·智绘未来”为主题,设置了数字经济、数字社会和乡村振兴等七大赛题,目前正在报名阶段。此外,2020年成立的浙江省数字创新实践基地,则是一个集孵化、开发、交流、培训等于一体的众创平台。
03
展望未来:“数据温饱”到
“数据小康”升级数据提质
第一阶段,数字化改革启动前,初步解决了公共数据的流通性问题。通过跨地区、跨部门、跨层级共享,让各地政府部门有数可用。如果将数源单位(上游)、公共数据平台(中游)和使用单位(下游)的数据流通链路看成一条“河流”,那么河流的上、中、下游均“有水可喝”,基本实现“数据温饱”。
第二阶段,数字化改革启动后,公共数据的主要矛盾从解决数据流通性转变为提升数据质量。仅实现“数据温饱”已不能满足需求——上、中、下游除了关注是否有水可喝,更关注水质的优劣——数据不仅要有,而且要可用,更要好用、易用。这对公共数据的时效性、准确性等要求更高,数据提质成为普遍需求,“数据小康”的实现势在必行。
提升公共数据质量,是一个上、中、下游合力参与数据治理的过程。放眼未来,数据提质需要以下两个抓手:
设置数据质量认定标准
理想的状态是,上游的数源单位在提供数据的时候需附带一份“自测报告”,中游的公共数据平台需提供一份“检测报告”,下游的使用单位在接收到数据后需提供一份“验收报告”。由此一来,数据共享的上、中、下游对数据质量层层把关,形成质量管理闭环。
为公共数据打“质量分”
例如,某一类本应按天更新的数据,有次过了3天才恢复更新,影响了数据的鲜活度,就需要扣除相应的分值。再如,一个名为“浙江省近5年婚姻登记数据”数据集,既缺失了台州市数据又不包含宁波市3年以前的数据,那么该数据集的质量分就不及格。
建议政府赋予相关的大数据主管部门以数据“质量分”的打分权限和数据质量监管的职能。类似市场监管局,打造专业的数据质量监管部门。同时,将数据质量分纳入政府部门的考核体系中,实行质量分“晾晒”,鞭策政府内部各数源单位从源头关注并保障数据质量。
数据质量认定标准和“质量分”,组成了数据质量管理和保障的两个抓手。犹如政府对河流的管理,将水质划分为Ⅰ-Ⅴ类标准并实施监测,以促进污水防控、提升水质,实施数据质量认定标准和打“质量分”,也将有效促进数据质量提升。这样,一些高频高质的数据将被筛选出来,数源单位的数据供给模式也将从过去发现问题后进行整改,转变为主动地保障数据质量。
经过持续的公共数据精细化治理,数据质量得到逐步提升,数据供应链将被锤炼得更强。
结语
04
【数字政府·观点视角】数字赋能精准防疫,但人的担当才是关键
【数字政府·场景剖析】广东省助力老年人跨越“数字鸿沟”
【整体智治·场景解剖】萧山:围绕数字化党建,城厢街道开启“智治”之路
内容来源 / 数字浙江DZJ,2021年8月10日
今日编辑 / 黄欣雨
责任编辑 / 戴晟昱
城市大脑研究院提供开放研讨平台,所有文章仅代表作者个人观点,欢迎共同探讨。原创文章,转载请注明来源:城市大脑研究院。部分图片来源于网络,如涉及版权问题,敬请及时联系我们。